Мона Лиза рапира? Нов AI на Microsoft анимира лица от снимки
Мона Лиза към този момент може да прави повече от това да се усмихва, с помощта на новата технология за изкуствен интелект от Microsoft.
Миналата седмица откривателите на Microsoft описаха нов AI модел, който са създали, който може да снима неподвижно изображение на разположение и аудио клип на някой, който приказва, и автоматизирано да сътвори реалистично изглеждащо видео на този човек, който приказва. Видеоклиповете – които могат да бъдат направени от фотореалистични лица, както и от карикатури или творби на изкуството – са допълнени със завладяващо синхронизиране на устните и естествени придвижвания на лицето и главата.
В едно демонстрационно видео откривателите демонстрираха по какъв начин анимират Мона Лиза да рецитира комедиен рап от артиста Ан Хатауей.
Резултатите от AI модела, наименуван VASA-1, са по едно и също време занимателни и малко потресаващи в своята действителност. Microsoft сподели, че технологията може да се употребява за обучение или „ възстановяване на достъпността за хора с информационни провокации “, или евентуално за основаване на виртуални спътници за хора. Но също по този начин е елементарно да се види по какъв начин с инструмента може да се злоупотребява и да се употребява за показване на същински хора.
Това е проблем, който надвишава Microsoft: защото се появяват повече принадлежности за основаване на безапелационни изображения, видео и аудио, генерирани от AI, специалистите се тормозят, че злоупотребата им може да докара до нови форми на дезинформация. Някои също се тормозят, че технологията може в допълнение да наруши креативните промишлености от кино лентата до рекламата.
Засега Microsoft сподели, че не възнамерява да пусне модела VASA-1 на обществеността незабавно. Ходът е сходен на метода, по който сътрудникът на Microsoft OpenAI се оправя с терзанията към своя генериран от AI видео инструмент Sora: OpenAI нервира Sora през февруари, само че до момента го е дал единствено на някои професионални консуматори и професори по киберсигурност за задачите на тестването.
„ Ние се противопоставяме на всяко държание за основаване на подвеждащо или нездравословно наличие на действителни лица “, споделиха откриватели на Microsoft в обява в блог. Но, прибавиха те, компанията " няма проекти да пусне " продукта обществено, " до момента в който не сме сигурни, че технологията ще се употребява отговорно и в сходство с верните разпореждания. "
Новият AI модел на Microsoft е подготвен на многочислени видеоклипове на лицата на хората, до момента в който приказват, и е планиран да разпознава естествените придвижвания на лицето и главата, в това число „ придвижване на устните, изражение (без устни), взор и намигване, апропо “, споделиха откривателите. Резултатът е по-реалистично видео, когато VASA-1 анимира неподвижна фотография.
Например, в едно демонстрационно видео, настроено на клип на някой, който звучи разчувствуван, явно до момента в който играе видеоигри, говорещото лице има сбръчкани вежди и свити устни.
AI инструментът може също да бъде ориентиран за основаване на видеоклип, в който обектът гледа в избрана посока или показва характерна страст.
При деликатно вглеждане към момента има признаци, че видеоклиповете са машинно генерирани, като рядко намигване и пресилени придвижвания на веждите. Но Microsoft сподели, че има вяра, че неговият модел „ доста превъзхожда “ други, сходни принадлежности и „ проправя пътя за ангажираност в действително време с реалистични аватари, които емулират човешкото държание при диалог “.